好的,今天要繼續接著昨天的話題,因為這個在神經網路歷史還蠻重要的,所以我們來了解一下。
在 ImageNet 資料庫完成後,就開始辦比賽 ILSVR(ImageNet Large Scale Visual Recognition Competition)年度大規模視覺識別挑戰賽,下圖是歷屆得勝模型名稱和辨識的錯誤率。
這篇文章有整理介紹,可以看一下,ILSVRC 歷屆的深度學習模型,不過先不要去糾結裡面的模型,大概了解一下各模型的差異點就好,等我們之後熟悉後再回來研究.
剛開始是由 ML及 SVM 等技術逐鹿,然而就在五年前(2012),深度學習之父 Hinton 的高徒 Alex Krizhevsky 首次採用深度學習架構參與此競賽, (論文連結),並以極大的差距擊敗了使用 Support Vector Machine 技術 Xerox Research Centre Europe 隊伍,自始以後,揭開了 Deep learning 吸引全球關注嶄露頭角的布幔。
我們記住這個時間點,在 2012 用了深度學習架構之後,電腦視覺研究就大爆發了!
另一個要記住的點,在這個時間點 GPU 的需求也大爆發,這篇介紹的很讚 2012年令深度學習和NVIDIA股價火爆起來的真正關鍵──GPU
大家都瘋了,NVIDIA 也瘋了。沒想到採用 GPU 運算的深度學習能有如此殺傷力強大的效果,運算速度是 CPU 的 70 倍以上,終於讓深度學習真正火爆起來。2012 年之後的 ImageNet 競賽,大家都紛紛採用 GPU 做運算。
目前要做訓練的話,CUDA Toolkit 都需要裝來用,加快訓練速度。說到這裡,我的 macbook pro 很尷尬,我一度想去買 eGPU 外接顯示卡盒來用。好,扯遠了。
然後物件偵測技術也開始快速發展, 這裡有件研究者 hoya012,做了一個完整物件偵測架構的整理,感恩他。用紅色部份是他覺得需要先了解的論文,有時間的話其他論文也需要閱讀。
傳送門
我現在只比較熟 yolo v3,之後有機會再整理一篇實作練習的記錄。這裡是 yolo 研究者Joseph Redmon 的演講,值得看一看。
這篇大都是導讀,再整理一下參考文章